Intro a R y RStudio
Scripts
Tipos de valores
Vectores, Funciones y DataFrames
09/03/2022
Intro a R y RStudio
Scripts
Tipos de valores
Vectores, Funciones y DataFrames
Instalación de paquetes y activación de librerías.
Importar y exportar datos.
Proyectos
Funciones exploratorias.
Fuentes para descargar datos.
Un paquete (package) es una colección de funciones, datos y documentación que debemos cargar para poder expandir las herramientas de R.
En la web de R se puede consultar la lista de paquetes “oficiales” disponibles.
Las librerías son conjuntos de instrucciones que albergan scripts que pueden ser ejecutados con instrucciones inherentes de la librería, en general, estas vienen contenidas dentro de paquetes que deben ser preinstalados para poder usarlas.
¿Qué es github? Github es un repositorio digital, básicamente un Google Drive para código. Gran parte de los paquetes que forman parte del repositorio oficial de R (CRAN) comenzaron su vida en github.
Allí podremos encontrar paquetes que aún no están aprobados para ser parte de CRAN, así como también versiones de desarrollo (experimentales) con funciones nuevas o cambios que aún están siendo probados por los desarrolladores.
Si queremos instalar un paquete desde github podemos hacerlo a través del paquete {devtools}
Para instalar paquete debemos correr: install.packages(“devtools”)
El archivo ReadMe suele tener información para el uso y descarga del paquete. El formato suele ser: devtools::install_github(”usuario/repositorio”)
Luego llamamos a los paquetes como veníamos haciendo antes library(paquete) y luego la función que necesitemos.
Fijarnos qué tipo de archivo queremos importar (csv, xlsx, txt, etc.)
Elegimos la función que vamos a usar para importar ese archivo.
Si el archivo está en nuestro equipo, es recomendable que esté alojado en la carpeta de nuestro proyecto. Recordatorio: consultemos a R donde está nuestro directorio de trabajo con getwd() y si es necesario establezcamos una nueva ruta con setwd()
Si el archivo está subido en algún portal web, podemos descargarlo en nuestro equipo o copiar la ruta de descarga y pegarla en la función que vamos a usar en R.
Utilizaremos la base de datos de elecciones 2021 de Salta
En el script de clase van a ver como importar online
Tener en cuenta la ruta por la cual compartimos el archivo.
base_salta21 <- read_csv("~/Documents/Ministerio_Interior/OPE_intro_a_R/clase_2/data/escrutinio_generales_Salta2021.csv")
Si se la compartimos a otra persona, se rompe
Si cambiamos de computadora, se rompe
Si lo cambiamos de lugar, se rompe
Es la mejor forma de trabajar con Rstudio. Cada proyecto permite segmentar sólo la información y recursos útiles en una misma carpeta (directorio) de trabajo.
Utilizar proyectos nos permite continuar las tareas desde donde las dejamos la última vez al terminar una sesión. Es sólo cuestión de recuperar el proyecto deseado la próxima vez que abrimos RStudio, cliqueando en File -> Recent Projects -> "Mi_proyecto"
Importante: Antes de crear un proyecto, siempre verifiquemos en que carpeta estamos. Es recomendable tener todos los proyectos de R organizados como subcarpetas de un mismo directorio. (Ver archivo como_nombrar_cosas)
Ventajas:
Le indicamos a R dónde “vive” nuestra carpeta de trabajo
La ruta ya no contiene ninguna referencia personal que impida ser abierto en otra computadora
RECOMENDACION
SIEMPRE TRABAJAR CON PROYECTOS
Crear una carpeta donde alojar el proyecto de trabajo
Crear una estructura de carpetas similar a la propuesta de ejemplo
En la carpeta data incorporar la base de datos provista
Crear un script de trabajo y alojarlo en la carpeta script
Prueben utilizando head(), tail(), names() y View()
¿Que tarea realizan estas funciones?
Leemos la base de datos
Utilizamos algunas de las funciones exploratorias propuestas
Describimos brevemente la base de datos (tip tiene NAs? podemos describir estadisticamente alguna columna?)
Extraemos todos los registros de las columnas 1,3,5,6,9 y 10. Guardarlo en un nuevo dataframe.
Exportaremos ese dataFrame como un archivo .csv
Seleccionar una base de datos de su interés y crear un proyecto
Importar el archivo y aplicar funciones descriptivas.
Guardar códigos ejecutados en un script
No olvidar comentar cada paso utilizando los #
Enviarlo por Slack.